当前位置: 开发笔记 > 编程语言 > 正文

机灵鬼|灵机_flink缓存问题处理过程，看我十八般武艺

作者：燕阳阳消_469 | 来源：互联网 | 2023-07-26 18:55

篇首语：本文由编程笔记#小编为大家整理，主要介绍了flink缓存问题处理过程，看我十八般武艺相关的知识，希望对你有一定的参考价值。1、问题描述

篇首语：本文由编程笔记#小编为大家整理，主要介绍了flink 缓存问题处理过程，看我十八般武艺相关的知识，希望对你有一定的参考价值。

1、问题描述

作为flink小白&＃xff0c;第一次写flink的任务&＃xff0c;所以战战兢兢的复写了官方的demo&＃xff0c;还好一切顺利&＃xff0c;自信心倍增&＃xff0c;开始进入业务需求。

但是作为一个新手不踩几个坑那说不过去&＃xff0c;所以遇上了第一个大的门槛。

1.1 版本信息

flink版本&＃xff1a;1.15.2

java 版本&＃xff1a;jdk11

OS&＃xff1a;Ubuntu 18.04

1.2 lib 包冲突的问题

第一次使用flink 哪知道flink还有个lib 目录&＃xff0c;在使用的过程中出现了包的冲突&＃xff0c;主要其他同学在测试的过程中瞎鸡儿搞&＃xff0c;放了几个包在lib下&＃xff0c;也莫名其妙&＃xff0c;不过好在身边有人帮忙解决了问题&＃xff0c;将maven中的flink提供的核心包设置为provided&＃xff0c;这个很简单。

1.3 缓存问题

这个问题最初不是我遇到的&＃xff0c;是同事遇到了&＃xff0c;但是花了好多时间也没解决&＃xff0c;就放弃了。我接过来处理。这里说下背景&＃xff0c;flink我们使用的是standalone 模式&＃xff0c;并且是另外一个同事安装的。也不知道做了什么配置&＃xff0c;也是第一次写flink&＃xff0c;甚至都不知道怎么提交任务&＃xff0c;在同事手把手教的情况下上车&＃xff0c;所以直接上手难度挺高。

开发的一个任务&＃xff0c;提交之后&＃xff0c;因为有问题&＃xff0c;所以直接报错了&＃xff0c;看下报错日志。

看日志还是挺明显的&＃xff0c;proto解析失败&＃xff0c;遇到bug解决bug&＃xff0c;所以后面修改代码&＃xff0c;做了异常捕获&＃xff0c;但是不管怎么修改&＃xff0c;每次提交都是包这个错误&＃xff0c;真的是头秃&＃xff0c;解决不了。

看下等会一直在说的代码&＃xff0c;这个类主要是做kafka数据的解析&＃xff0c;将kafka中的数据解析成VehData。

public class BsmSchema implements DeserializationSchema &＃64;Override public BsmDTO.VehData deserialize(byte[] bytes) throws IOException try if (Objects.nonNull(bytes) && bytes.length !&＃61; 0) BsmDTO.VehData bsm &＃61; BsmDTO.VehData.parseFrom(bytes); return bsm; catch (Exception e) return null; &＃64;Override public boolean isEndOfStream(BsmDTO.VehData dpe) return false; &＃64;Override public TypeInformation getProducedType() return TypeInformation.of(new TypeHint<>() );
2、解决过程

2.1 proto 解析失败

这个还是很简单的&＃xff0c;因为数据的问题导致数据解析失败&＃xff0c;所以直接通过try catch 对异常数据不处理&＃xff0c;在本地测试通过后是正常的&＃xff0c;打包之后&＃xff0c;上传jar &＃xff0c;直接上面同样的错误。无语

2.2 确认try catch

因为报了同样的错误&＃xff0c;所以认为没有打包进最新的代码&＃xff0c;直接反编译代码&＃xff0c;确认代码中存在try catch

2.3 去除proto解析的问题

因为一直报proto解析错误&＃xff0c;那我就索性去掉了proto的解析部分&＃xff0c;我直接返回了一个null&＃xff0c;可以看到不会再有proto解析了。

public BsmDTO.VehData deserialize(byte[] bytes) throws IOException // try // if (Objects.nonNull(bytes) && bytes.length !&＃61; 0) // BsmDTO.VehData bsm &＃61; BsmDTO.VehData.parseFrom(bytes); // return bsm; // // catch (Exception e) // return null;

结果就是同样的报错&＃xff0c;BsmSchema 的15行&＃xff0c;这就很奇怪了&＃xff0c;代码里根本没这一行代码&＃xff0c;当然也通过反编译确认了没有这个代码。这里基本上验证了Flink运行的根本不是我刚刚提交的最新代码。真的是奇怪啊&＃xff0c;这里我也确认了缓存的存在。

2.4 其他的任务运行正常

因为报的proto解析失败&＃xff0c;BsmSchema 的15行&＃xff0c;刚好有一个其他任务也是使用的这个BsmSchema &＃xff0c;但是其他任务运行正常&＃xff0c;所以猜测不是这个类的问题。

2.5 手动清除缓存

web.tmpdir&＃xff1a;/tmp/flink-web-600c749d-ca2b-4467-a557-923c955632a8

Job Manager下有这个web.tmpdir 的配置路径&＃xff0c;所有上传的jar包都会存在这里。

手动清除之前上传的包&＃xff0c;再次上传后&＃xff0c;依然同样的报错&＃xff0c;无语死了

2.6 控制台运行&＃xff0c;试图越过缓存

因为之前一直使用的是web ui 提交的&＃xff0c;所以怀疑是web 系统做了缓存&＃xff0c;所以直接上传jar包到lib下&＃xff0c;通过flink运行

flink run xxx.jar ,运行过后同样的报错&＃xff0c;只不过这次展示在控制台。

最终的结果还是报错&＃xff0c;报同样的错&＃xff0c;有点崩溃了。

2.7 修改包名&＃xff0c;试图越过缓存

猜测是缓存的问题&＃xff0c;还是想越过缓存&＃xff0c;猜测是jar的名字&＃xff0c;所以在打包的时候直接修改了jar的名字。

还是同样的报错&＃xff0c;没有一丝丝防备&＃xff0c;也没有一丝丝顾虑&＃xff0c;还是报错。

2.8 复刻环境&＃xff0c;重现问题

实在没招了&＃xff0c;只能怪环境了&＃xff0c;还能咋样&＃xff0c;在其他的机器上复刻一个同样版本的flink&＃xff0c;然后提交任务发现执行正常&＃xff0c;唉&＃xff0c;还是那个环境的问题&＃xff0c;这到底是为什么呐&＃xff0c;难受

2.9 怀疑是包冲突导致

没有什么解决方案&＃xff0c;就在这疑神疑鬼&＃xff0c;怀疑是包冲突导致的&＃xff0c;虽然没有一丝丝的痕迹显示如此&＃xff0c;但是因为自己有限的知识&＃xff0c;只能瞎猜了&＃xff0c;把很多包都设置为provided的&＃xff0c;打包上传&＃xff0c;报错依旧没有解决。

2.10 求助大佬

寻寻觅觅&＃xff0c;冷冷清清&＃xff0c;凄凄惨惨戚戚&＃xff0c;实在没招了&＃xff0c;只能向大佬求助&＃xff0c;在描述一顿问题之后&＃xff0c;几个大佬都说没遇到过类似的问题&＃xff0c;没办法了&＃xff0c;只能自力更生。

3、解决方案

经过2天的折腾&＃xff0c;实在没招了&＃xff0c;也没有人求助了&＃xff0c;只能自己瞎捉摸了&＃xff0c;中午睡觉都在想这件事。唉&＃xff0c;难受。

在下午的时候灵机一动&＃xff0c;包名修改了没用&＃xff0c;试着修改mainclass 的名字&＃xff0c;修改之后&＃xff0c;上传&＃xff0c;果然解决了&＃xff0c;困扰多日的问题终于解决了&＃xff0c;在那一刻我被自己的聪明震惊了。哈哈&＃xff0c;我可真是个机灵鬼。

4、总结

事后没有去重现这次问题&＃xff0c;但是大概猜到了这个业务逻辑&＃xff0c;

不知道是什么原因导致将flink 对提交的jar 做了类似缓存的操作&＃xff0c;这个缓存的key 就是mainClass 的类名&＃xff0c;所以换了类名之后就解决了问题

可能有人会问为什么不重启flink&＃xff0c;首先原因是因为有一些任务在运行&＃xff0c;重启会影响他们&＃xff0c;也会破坏这个问题环境&＃xff0c;

最后在解决问题的过程中也学习了一些flink其他的知识。解决问题的成就感满满

推荐阅读

select
Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨

在《Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨》中，详细介绍了Cocos2d-x的基础概念，并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解，例如在处理鱼的运动过程中，可以通过编写自定义函数来动态计算角度变化，利用CallFunc回调机制实现高效的游戏逻辑控制。此外，文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏，为开发者提供了实用的编程技巧和最佳实践。 ... [详细]

蜡笔小新 2024-11-11 14:49:31
select
技术日志：深入探讨Spark Streaming与Spark SQL的融合应用

技术日志：深入探讨Spark Streaming与Spark SQL的融合应用 ... [详细]

蜡笔小新 2024-10-30 14:20:53
int
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
int
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
int
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
int
深入解析Properties属性类及其应用

属性类 `Properties` 是 `Hashtable` 类的子类，用于存储键值对形式的数据。该类在 Java 中广泛应用于配置文件的读取与写入，支持字符串类型的键和值。通过 `Properties` 类，开发者可以方便地进行配置信息的管理，确保应用程序的灵活性和可维护性。此外，`Properties` 类还提供了加载和保存属性文件的方法，使其在实际开发中具有较高的实用价值。 ... [详细]

蜡笔小新 2024-11-11 13:55:43
select
使用Shell脚本高效部署MHA高可用集群

本文介绍了如何利用Shell脚本高效地部署MHA（MySQL High Availability）高可用集群。通过详细的脚本编写和配置示例，展示了自动化部署过程中的关键步骤和注意事项。该方法不仅简化了集群的部署流程，还提高了系统的稳定性和可用性。 ... [详细]

蜡笔小新 2024-11-10 10:15:46
int
kafka client源码阅读：KafkaProducer

基于2.1.0构造函数初始化accumulator，这是一个发送的缓冲队列管理器this.accumulatornewRecordAccumulator(logContext,co ... [详细]

蜡笔小新 2024-10-14 15:52:44
int
深入解析Android Audio系统中的mpAudioPolicy->get_input

在分析Android的Audio系统时，我们对mpAudioPolicy->get_input进行了详细探讨，发现其背后涉及的机制相当复杂。本文将详细介绍这一过程及其背后的实现细节。 ... [详细]

蜡笔小新 2024-11-12 18:52:04
config
基于Linux开源VOIP系统LinPhone[四]

****************************************************************************************** ... [详细]

蜡笔小新 2024-11-12 11:00:11
int
基于Net Core 3.0与Web API的前后端分离开发：Vue.js在前端的应用

本文介绍了如何使用Net Core 3.0和Web API进行前后端分离开发，并重点探讨了Vue.js在前端的应用。后端采用MySQL数据库和EF Core框架进行数据操作，开发环境为Windows 10和Visual Studio 2019，MySQL服务器版本为8.0.16。文章详细描述了API项目的创建过程、启动步骤以及必要的插件安装，为开发者提供了一套完整的开发指南。 ... [详细]

蜡笔小新 2024-11-11 10:58:21
config
C#中Using里使用单例的问题

又给自己挖了一个坑跳进去。KafkaManager使用单例模型获取到一个producer，然而自己代码里用的时候加了一个using然后自己在做测试的时候，for循环加10条数据发送 ... [详细]

蜡笔小新 2024-10-20 13:21:09
int
Storm集成Kakfa

一、整合说明Storm官方对Kafka的整合分为两个版本，官方说明文档分别如下：StormKafkaIntegratio ... [详细]

蜡笔小新 2024-10-16 20:20:41
select
Alibaba珍藏版mybatis手写文档，值得一读！

一面问题：MySQLRedisKafka线程算法mysql知道哪些存储引擎，它们的区别mysql索引在什么情况下会失效mysql在项目中的优化场景&# ... [详细]

蜡笔小新 2024-10-14 13:45:07
join
经验总结：你觉得你真的了解Kafka消费者吗？附超全教程文档

为什么要公开这些面试题？原因一：身边从事Java开发的人员越来越多，我的表弟表妹们，朋友的表弟表妹们，朋友的 ... [详细]

蜡笔小新 2024-10-12 18:04:50

燕阳阳消_469

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章